突破存储与算力极限,助力生命科学领域破译“达芬奇密码”
基因技术作为被大家公认的有可能改变人类命运的关键技术,如今已经渗入到我们的日常生活。通过基因测序,可以对孕妇进行无创伤的产前先天遗传缺陷检测,也可以通过检测肿瘤基因特征片段提早预防癌症,还可以通过基因技术来寻找最优的药物治疗方案。
目前市场上主要采用的是第二代测序技术。先将整个基因组打乱,切成随机碎片,然后测定每个小片段序列,最终利用计算机对这些切片进行排序和组装,并确定它们在基因组中的正确位置。这个过程看似简单,但基因测序工程动辄需要数万或数十万个基因测序及模型建立,需要很大的计算和存储资源。所以要求HPC平台需要满足以下几点:
第一,要满足大数据量需求。基因数据的产出量基本上每18个月就要增加一个数量级,所以数据产出量一直处于快速增长的状态。如某全球最大的基因组学研发机构目前拥有超过200台测序仪,其中用于新生胎儿基因测序每天大约产生10000个样本 ,与数万个正常胎儿几十TB的基因组数据进行差异统计分析,数据计算量巨大,这就必须要求HPC系统具有海量数据存储能力。
第二,对内存需求量大。序列对比是所有生物信息学序列分析SA中最主要的计算任务。在后期基因序列分析时,往往会进行序列对比,这就要求要将海量数据一次性载入到内存并加以处理,而不适宜分批导入,这就对内存有了非常严苛的容量要求。
第三,对计算力要求高。第二代基因测序技术又包含全基因组重测序、外显子组测序、目标靶向区域测序和转录组测序。每个测序方法所使用的软件繁多,合起来常用的估计有上百个软件了。根据实际测试,目前基因测序所用的专用软件,用GPU来跑还不够成熟和稳定,所以对CPU的性能要求就变得更高。
针对上述需求,Cloudam云端自主研发了一站式云超算平台,该平台通过对阿里云、腾讯云、AWS、微软云、谷歌云、华为云等六大主流公有云的资源整合,配合独有的并行计算调度管理模块,能为用户快速构建与安装部署一个“独享式“云端超算中心资源,提供从数据、软件到算力的全流程服务,帮助企业简单便捷的管理大数据,真正做到为企业客户降本增效。
(可点击查看大图)
在算力方面,Cloudam云端一站式云超算平台能够提供100,000个计算核心,可快速完成全基因序列拼接、比对工作;在数据存储方面,Cloudam云端一站式云超算平台支持PB级别业务场景,内置的并行文件系统可提供极高的IO性能,最高可达208万IOPS,满足了基因测序大文件及小文件并发带宽需求;在软件方面,平台预装了多款基因测序的高性能计算软件,例如BLAST+、Burrows-Wheeler Aligner、BWA、GATK等,用户无需安装,即可开箱即用。还支持:
• 实时调用最新硬件资源,且价格与传统超算资源的持平
• 极速文件传输,数据的输入/输出速度比传统超算快10倍以上
• 支持图形界面、命令行、工作站多种作业方式,灵活便捷
• 7x24小时全天候技术支持服务,30分钟内响应
......
除基因测序外,Cloudam云端还提供了蛋白折叠、虚拟筛选、分子动力模拟、分子设计、蛋白结构模拟等应用场景的解决方案,助力生命科学领域的研究和发展。
联系我们立刻获取
完整版云E生命科学行业解决方案
立刻使用Cloudam云端一站式云超算平台,即可开启简单、快速、便捷的高性能计算之旅,无需再为繁琐的细节而烦恼,就能沉浸于专业研究与创新中。
- END -
Cloudam云端
扫码关注我们
Cloudam云端一站式云超算平台
操作便捷 超低门槛